期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 融合行为词的罪名预测多任务学习模型
郭晓, 陈艳平, 唐瑞雪, 黄瑞章, 秦永彬
《计算机应用》唯一官方网站    2024, 44 (1): 159-166.   DOI: 10.11772/j.issn.1001-9081.2023010029
摘要146)   HTML3)    PDF (2318KB)(37)    收藏

随着人工智能技术在司法领域的应用,依据案情描述预测所属罪名成为一项重要研究内容。案情内容术语专业,描述言简意赅,而现有方法却往往依赖文本特征,忽略了不同案件相关要素的差异性,缺乏对案情行为词要素的有效利用。为了解决此类问题,提出一种融合行为词的罪名预测多任务学习模型。首先,由边界识别器生成行为词跨度,提炼出案情核心内容;其次,通过构建行为词的结构特征预测所属罪名;最后,将行为词识别和罪名预测进行统一建模,通过共享参数的方式增强模型的泛化能力。通过构建行为词识别和罪名预测的多任务数据集进行验证,实验结果表明该模型识别行为词任务的F值达到了83.27%,罪名预测任务的F值达到了84.29%,与BERT-CNN模型相比,分别提高了0.57%和2.61%,验证了该模型对行为词识别和罪名预测的优势。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于反绎学习的裁判文书量刑情节识别
李锦烨, 黄瑞章, 秦永彬, 陈艳平, 田小瑜
《计算机应用》唯一官方网站    2022, 42 (6): 1802-1807.   DOI: 10.11772/j.issn.1001-9081.2021091748
摘要419)   HTML14)    PDF (1407KB)(104)    收藏

针对司法领域标记数据匮乏、标注质量不高、存在强逻辑性导致裁判文书量刑情节识别效果不佳的问题,提出一种基于反绎学习的量刑情节识别模型ABL-CON。首先结合神经网络与领域逻辑推理,通过半监督学习方法,使用置信学习方法表征情节识别置信度;然后修正无标签数据经过神经网络产生的不合逻辑的错误情节,重新训练识别模型,以提高识别精度。在自构建的司法数据集上的实验结果表明,使用50%标注数据与50%无标注数据的ABL-CON模型在Macro_F1值和Micro_F1值上分别达到了90.35%和90.58%,优于同样条件下的BERT和SS-ABL,也超越了使用100%标注数据的BERT模型。ABL-CON模型通过逻辑反绎修正不符合逻辑的标签能够有效提高标签的逻辑合理性以及标签的识别能力。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于实体边界组合的关系抽取方法
李昊, 陈艳平, 唐瑞雪, 黄瑞章, 秦永彬, 王国蓉, 谭曦
《计算机应用》唯一官方网站    2022, 42 (6): 1796-1801.   DOI: 10.11772/j.issn.1001-9081.2021091747
摘要247)   HTML10)    PDF (1005KB)(83)    收藏

关系抽取旨在从文本中抽取实体与实体之间的语义关系。作为关系抽取的上层任务,实体识别所产生的错误将扩散至关系抽取,从而导致级联错误。与实体相比,实体边界粒度小且具有二义性,更易识别。因此,提出一种基于实体边界组合的关系抽取方法,通过跳过实体,对实体边界两两组合来进行关系抽取。由于边界性能高于实体性能,所以错误扩散的问题得到了缓解;并且通过特征组合的方法将实体类型特征和位置特征加入模型中,性能得到了进一步提高,再次减轻了错误扩散带来的影响。实验结果表明,所提方法在ACE 2005英文数据集的宏平均F1值优于表格-序列编码器方法8.61个百分点。

图表 | 参考文献 | 相关文章 | 多维度评价
4. 基于用户行为特征的多维度文本聚类
黎万英, 黄瑞章, 丁志远, 陈艳平, 徐立洋
计算机应用    2018, 38 (11): 3127-3131.   DOI: 10.11772/j.issn.1001-9081.2018041357
摘要912)      PDF (970KB)(484)    收藏
传统多维度文本聚类一般是从文本内容中提取特征,而很少考虑数据中用户与文本的交互信息(如:点赞、转发、评论、关注、引用等行为信息),且传统的多维度文本聚类主要是将多个空间维度线性结合,没能深入考虑每个维度中属性间的关系。为有效利用与文本相关的用户行为信息,提出一种结合用户行为信息的多维度文本聚类模型(MTCUBC)。根据文本间的相似性在不同空间上应该保持一致的原则,该模型将用户行为信息作为文本内容聚类的约束来调节相似度,然后结合度量学习方法来改善文本间的距离,从而提高聚类效果。通过实验表明,与线性结合的多维度聚类相比,MTCUBC模型在高维稀疏数据中表现出明显的优势。
参考文献 | 相关文章 | 多维度评价
5. 基于狄利克雷多项分配模型的多源文本主题挖掘模型
徐立洋, 黄瑞章, 陈艳平, 钱志森, 黎万英
计算机应用    2018, 38 (11): 3094-3099.   DOI: 10.11772/j.issn.1001-9081.2018041359
摘要420)      PDF (1100KB)(461)    收藏
随着文本数据来源渠道越来越丰富,面向多源文本数据进行主题挖掘已成为文本挖掘领域的研究重点。由于传统主题模型主要面向单源文本数据建模,直接应用于多源文本数据有较多的限制。针对该问题提出了基于狄利克雷多项分配(DMA)模型的多源文本主题挖掘模型——多源狄利克雷多项分配模型(MSDMA)。通过考虑主题在不同数据源的词分布的差异性,结合DMA模型的非参聚类性质,模型主要解决了如下三个问题:1)能够学习出同一个主题在不同数据源中特有的词分布形式;2)通过数据源之间共享主题空间和词项空间,使得数据源间可进行主题知识互补,提升对高噪声、低信息量的数据源的主题发现效果;3)能自主学习出每个数据源内的主题数量,不需要事先给定主题个数。最后通过在模拟数据集和真实数据集的实验结果表明,所提模型比传统主题模型能更有效地对多源数据进行主题信息挖掘。
参考文献 | 相关文章 | 多维度评价
6. 基于事件表示和对比学习的深度事件聚类方法
蒋小霞 黄瑞章 白瑞娜 任丽娜 陈艳平
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023060851
预出版日期: 2023-08-23

7. 基于掩码提示与门控记忆网络校准的关系抽取方法
魏超 陈艳平 王凯 秦永彬 黄瑞章
《计算机应用》唯一官方网站    DOI: 10.11772/j.issn.1001-9081.2023060818
预出版日期: 2023-08-30

8. WISA2023+37 基于多尺度混合注意力卷积神经网络的关系抽取
唐媛 陈艳平 扈应 黄瑞章 秦永彬
  
9. WISA2023+10 面向机器阅读理解的边界感知方法
刘青 陈艳平 邹安琪 黄瑞章 秦永彬